En este documento se realizará un análisis estadístico y gráfico del precio del arroz cultivado y comercializado en las principales centrales de abasto de México.
# Con la librería cargada, se importan los datos de los precios del arroz:
Datos=read.xlsx("datosArroz.xlsx")
# Convertimos la columna Fecha que tiene un origen de Excel el 30 de diciembre de 1899 para que quede la fecha correcta:
Datos$Fecha=as.Date(Datos$Fecha,origin="1899-12-30")
# Se presentan los datos importados con la función datatable que es para páginas web:
datatable(Datos)
Como se puede apreciar, la tabla anterior se realizó con la función datatable que es parte de la librería DT. Este tipo de tabla solo puede utilizarse para presentarse en páginas web, dashboards o documentos html o en línea. No será útil para compilar documentos en word o en pdf. Para ello se utilizan otras librerías.
Con los datos anteriores, nos interesa saber cuáles Estados se encuentran registrados en la nase de datos Datos. Para esto, debemos convertir la columna Origen de ser un objeto tipo character a un objeto tipo factor. Este último tipo de objeto es útil para realizar análisis estadísticos y gráficos y encontrar factores o clase (grupos, Estados)
#Convertimos a objeto tipo factor los datos de la columna Origen:
Datos$Origen=factor(Datos$Origen)
# Imprimimos los "niveles" de factores (léase Estados) que hay registrados:
levels(Datos$Origen)
## [1] "Campeche" "Chiapas" "Chihuahua" "Coahuila"
## [5] "Colima" "Distrito Federal" "Durango" "Guanajuato"
## [9] "Guerrero" "Importación" "Jalisco" "México"
## [13] "Michoacán" "Morelos" "Nacional" "Nayarit"
## [17] "Nuevo León" "Oaxaca" "Puebla" "Querétaro"
## [21] "Quintana Roo" "San Luis Potosí" "Sin Especificar" "Sinaloa"
## [25] "Sonora" "Tabasco" "Tamaulipas" "Veracruz"
## [29] "Yucatán" "Zacatecas"
En nuestro análisis nos interesa solamente los datos del Estado de Michoacán. Para ello generaremos un objeto llamado datosMichoacan que contendrá solamente los datos del Estado de Michoacán.
# Seleccionamos los datos del Estado de Michoacán:
datosMichoacan=subset(Datos,Origen=="Michoacán")
# Imprimimos la tabla correspondiente:
datatable(datosMichoacan)
Repetimos el proceso de filtrado anterior pero ahora utilizaremos la librería dplyr:
# Seleccionamos los datos del Estado de Michoacán con la función filter de dplyr:
datosMichoacan2=Datos %>% filter(Origen=="Michoacán")
Ahora nos interesa filtrar, de manera conjunta, los datos del Estado de Michoacán y de la centras de abastos de Morelia (Destino==“Michoacán: Mercado de Abasto de Morelia”):
# Seleccionamos los datos del Estado de Michoacán con la función filter de dplyr:
datosMichoacan3=Datos %>% filter(Origen=="Michoacán")%>% filter(Destino=="Michoacán: Mercado de Abasto de Morelia")
datatable(datosMichoacan3)
Ahora, nos interesa saber cuál es el precio promedio del arroz en México por fecha. Para ello, utilizaremos la función group_by de dplyr con la función summarise:
# Generamos la tabla de datos de rpecios promedio por fecha:
preciosPromedio=Datos %>% group_by(Fecha) %>% summarize(PrecioPromedio=mean(Precio.Frecuente))
datatable(preciosPromedio)
Podemos generar una gráfica simple y fea como la siguiente:
plot(x=preciosPromedio$Fecha,y=preciosPromedio$PrecioPromedio,type="l")